import pandas as pd
import matplotlib.pyplot as plt

# 1. 读取 CSV 文件
df = pd.read_csv("data/ETTh1问题.csv", parse_dates=["date"])
# 2. 设置时间戳为索引
df["date"] = pd.to_datetime(df["date"])  # 转换为时间格式
df.set_index("date", inplace=True)
# # 3. 检查缺失值
# print("缺失值统计：")
# print(df.isnull().sum())
# 4. 选择插值方法
df_interpolated = df.interpolate(method="time")  # 时间序列插值
# # 5. 可视化填充结果
# plt.figure(figsize=(10, 5))
# plt.plot(df.index, df["HUFL"], label="原始数据", marker="o", linestyle="dashed")
# plt.plot(df.index, df_interpolated["HUFL"], label="插值后数据", marker="x")
# plt.legend()
# plt.xlabel("时间")
# plt.ylabel("HUFL 值")
# plt.title("数据插值前后对比")
# plt.show()
# 6. 保存处理后的数据
df_interpolated.to_csv("data/ETTh1_填充后.csv", index=True)
print("插值填充完成，已保存到 'ETTh1_填充后.csv'")

